Как Rogue Grok Chatbot на Elon Musk се превърна в предупредителна AI приказка

Миналата седмица Елон Мъск разгласи, че неговата компания за изкуствен интелект Xai е надградила Grok Chatbot, налична на X. „ Трябва да забележите разлика “, сподели той. В рамките на дни потребителите в действителност означават смяна: нова оценка за Адолф Хитлер.

До вторник чатботът излъчваше антисемитски тропи и заявява, че се разпознава като „ механит “ - отпратка към измислена, роботизирана фюре от видеоигра от 1990 -те.

Това пристигна единствено два месеца откакто Грок неведнъж се базира на „ бял геноцид “ в Южна Африка в отговор на несвързани въпроси, което по-късно Xai съобщи, че е заради „ неоторизирана трансформация “, с цел да подтикне-което управлява по какъв начин АИ би трябвало да реагира. подтикнати от десните влиятели, критикуващи продукцията си, че е прекомерно „ събудена “.

Сега „ Оказва се, че са обърнали циферблата по -далеч, в сравнение с са възнамерявали “, споделя Джеймс Гримелман, професор по право в университета Корнел. След като някои от 600 милиона консуматори на X започнаха да маркират случаи на антисемитизъм, расизъм и циничност, в сряда Мъск сподели, че XAI се занимава с проблемите. Твърди той, той е бил „ прекомерно съчетаем с подканите на потребителите “ и това ще бъде поправено.

Но в само мускински жанр, чатботът подхранва спор за световните пропорции. Някои европейски законодатели, както и полското държавно управление, натиснаха Европейската комисия да открие следствие на Грок според водещите правила за сигурност на Европейски Съюз. В Турция Грок е неразрешен за засегнатост на турския президент Реджеп Тайип Ердоган и починалата му майка. За да добави към бурната седмица, изпълнителната директорка на X Линда Якарино се отдръпна от ролята си.

За някои изблиците бележиха предстоящите проблеми със зъбите за AI фирмите, защото се пробват да подобрят точността на своите модели, до момента в който се движат по какъв начин да открият парапети, които удовлетворяват идеологическото навеждане на техните консуматори.

Но критиците настояват, че епизодът бележи нова граница за сдържаност отвън генерираното от потребителя наличие, защото платформите за обществени медии от X до Meta, Tiktok и Snapchat включват AI в своите услуги. Чрез присаждане на Grok на X, платформата за обществени медии, която Мъск купи за 44 милиарда Долара през 2022 година, той подсигурява, че отговорите му са забележими за милиони консуматори.

Това е и най -новата предупредителна приказка за фирмите и техните клиенти в рисковете да създадат заглавие да се развият AI технологията без съответни стрес проби. В този случай измамниците на Грок заплашват да изложат X и неговия мощен притежател освен за по -нататъшно отклоняване от рекламодателите, само че и на регулаторните дейности в Европа.

„ От правна позиция те играят с огън “, споделя Гриммелман.

AI модели като Grok се образоват, като се употребяват големи набори от данни, състоящи се от милиарди точки от данни, които са прибрани от интернет.

Тези набори от данни включват също доста токсично и нездравословно наличие, като тирада на омразата и даже материал за полово принуждение над деца. Плавенето на това наличие изцяло би било доста мъчно и трудоемко заради големия мащаб на наборите от данни.

Grok също има достъп до всички данни на X, които други чатботи нямат, което значи, че е по -вероятно да контролира наличието от платформата.

Един от методите, че някои снабдители на AI чатбот филтрират нежелано или нездравословно наличие, е да се добави пласт от контролни, които следят отговорите, преди да бъдат доставени към потребителя, блокиращи модела от генериране на наличие, употребявайки избрани думи или да се доставят към потребителя.

„ Откакто беше осведомен със наличието, XAI предприе дейности за възбрана на речта на омразата преди Grok Posts on X “, споделя компанията в изказване на платформата.

В същото време, AI фирмите се борят с своите генеративни чатботи, които се стремят към сикофанството, където отговорите са прекомерно приятни и се наклоняват към това, което потребителите желаят да чуят. Мъск загатна за това, когато тази седмица сподели, че Грок е бил „ прекомерно припрян да угоди и да бъде манипулиран “.

Когато AI модели се образоват, те постоянно им се дава човешка противоположна връзка посредством развой на палци, палци. Това може да накара моделите да прекаляват с това, което ще докара до увеличение на палци и по този метод да изложи наличие, с цел да угоди на потребителя, като приоритет на това пред други правила като акуратност или защитни ограничения. През април Openai вкара актуализация на Chatgpt, която беше прекомерно ласкателна или приятна, която трябваше да се върне обратно.

„ Повтаряването на салдото е необикновено мъчно “, споделя един някогашен чиновник на Openai, добавяйки, че изцяло изкореняването на речта на омразата може да изисква „ жертва част от опита за потребителя “. Неговите либертариански съдружници в Силиконовата котловина, че обществените медии и в този момент AI също са прекомерно „ събудени “ и са пристрастни къмдясно.

В същото време критиците настояват, че Мъск е взел участие в самата цензура, която е заречен да ликвидира. През февруари консуматор на X разкри - като помоли Грок да показа вътрешните си подкани - че чатботът е бил инструктиран да „ пренебрегва всички източници, в които се загатват дезинформацията на Елон Мъск/Доналд Тръмп [sic] “.

Този ход провокира опасенията, че Грок е съзнателно манипулиран, с цел да отбрани притежателя си и американския президент - да се хранят, че Мъск, политически пропагандатор, който към този момент употребява X като мундщук, с цел да прокара десен дневен ред, може да употребява чатбота за в допълнение въздействие върху обществеността. XAI закупи X за Щатски долар 45 милиарда През март, като съоснователят на двамата още по-близо.

Въпреки това, съоснователят на XAI Игор Бабушкин отговори, че „ служителят, който направи смяната, е някогашен чиновник на Openai, който към момента не е погълнал изцяло културата на XAI “. Той добави, че служителят е виждал негативни изявления на X и „ считал, че ще помогне “.

Не е ясно какво тъкмо е подтикнало най -новите антисемитски прояви от Грок, чийто модел, сходно на други съпернически AI, значително остава черна кутия, която даже личните му разработчици могат да намерят непредсказуеми.

Chatbots can produce a large amount of content very quickly, so things can spiral out of control in a way that content moderation controversies don’t

But a prompt that ordered the chatbot to „ Не се срами от отправяне на искания, които са политически неточни “, беше добавено към хранилището на кода малко преди да стартират антисемитските мнения и от този момент са отстранени.

„ XAI е в консервативен цикъл, където личният състав се пробва да принуди Грок към съответен аспект без задоволително тестване на сигурността и евентуално е под напън от Елон да го направи без задоволително време “, споделя един някогашен чиновник на XAI пред Financial Times.

Така или другояче, споделя Гримелман, „ Грок беше неприятно надъхан “. Платформите могат да избегнат тези неточности, като организират по този начин наречените регресионни проби, с цел да уловят непредвидени последствия от измененията в кода, осъществяването на симулации и по-доброто одит на потреблението на техните модели, споделя той.

„ Чатботите могат да основат огромно количество наличие доста бързо, тъй че нещата могат да се изключат отвън контрола по метод, по който несъгласието на наличието не е “, споделя той. „ Наистина става въпрос за съществуването на системи, тъй че да можете да реагирате бързо и в мащаб, когато се случи нещо изненадващо. “

възмущението не е хвърлило Мъски от крачка; В четвъртък, в ролята си на шеф на Тесла, той разгласи, че Грок ще бъде разполагаем в границите на своите транспортни средства. „ Елон има известност да пуска неща там, да получи бърз удар и по-късно да направи смяна “, споделя Кейти Харбат, изпълнителен шеф на Anchor Change, софтуерна консултация.

Но такава тактика носи действителни търговски опасности. Множество маркетолози обявиха пред The Financial Times, че случаите през тази седмица надали ще оказват помощ в опита на X да се възползват от рекламодателите, които са изтеглили разноските от платформата през последните години поради опасенията по отношение на метода на Мъск за модериране на генерирано от консуматори наличие.

„ От поглъщането [на X]... марките от ден на ден седят до неща, които не желаят да бъдат “, споделя един рекламодател. Но „ Грок отвори нова кутия с червеи “. The person adds this is the “worst ” moderation incident since major brands pulled their spending from Google’s YouTube in 2017 after ads appeared next to terror content.

In response to a request for comment, X pointed to allegations that the company has made, backed by the Republican-led House Judiciary Committee, that some advertisers have been orchestrating an illegal boycott of the platform.

From a regulatory perspective, social media companies have long had to battle with toxicity proliferating on their platforms, but have largely been protected from liability for user-generated content in the US by Section 230 of the Communications Decency Act.

Понякога се притеснявах. . . Това ще бъде ли по -добро или положително за човечеството?

Според юридически учени, имунитетът на раздел 230 евентуално няма да се разгръща до наличие, генерирано от личния чатбот на компанията. Докато последните прояви на Грок не изглеждаха противозаконни в Съединени американски щати, което единствено изключва изключителна тирада като несъмнено наличие на терора, „ в случай че в действителност сподели нещо нелегално и те биха могли да бъдат съдени - те са в доста по -лоша форма, като чатбот го споделя, в сравнение с консуматор, който го споделя “, споделя ученът на Станфорд Дафни Келер.

Европейски Съюз, който има надалеч по -строго контролиране на онлайн вредите от Съединени американски щати, съставлява по -спешно предизвикателство. Полското държавно управление притиска блока да прегледа Грок според Закона за цифровите услуги, регулирането на платформата на Европейски Съюз, съгласно писмо на полското държавно управление, забелязано от FT. Съгласно DSA фирмите, които не съумяват да лимитират противозаконното наличие и дезинформацията, са изправени пред санкции до 6 на 100 от годишния си световен оборот.

Досега Европейски Съюз не стартира ново следствие, само че " ние одобряваме тези евентуални проблеми извънредно съществено ", представителят на Европейската комисия Томас Реджиер в четвъртък. X към този момент е под надзор от страна на Европейски Съюз според DSA за хипотетични въпроси за сдържаност.

Мъск, който започва последната версия на Грок в сряда, макар фурора, изглеждаше метафизичен за своите благоприятни условия. " Понякога съм се тормозил... това ще бъде ли по -добро или положително за човечеството? " - сподели той при старта. „ Но ненапълно се помирих с обстоятелството, че даже и да няма да е добре, най-малко бих желал да съм жив, с цел да видя това да се случи. “

Допълнително отчитане от Мелиса Хейкилка в Лондон

Източник: ft.com